查看原文
其他

【瞎七八扯】如何确定“真实”人口数量、分布以及流动?

数读菌 数读城事 2021-09-19

嗯,好像是一个新系列。俗话说的好,光挖坑不填坑,埋了自己也没人疼。(根本没有这句俗话好吗)

但是有一说一,写新系列的感觉大概就像是新买了一件衣服,虽然它不一定好看,但是总觉得自己穿上它可以更帅气!

言归正传,这个【瞎七八扯】的系列,就是瞎JB扯淡,别有啥期待,大部分是个人观点,纯粹瞎说,不要当真。(以前有人吐槽我光分析没结论是吧,哼,我现在光说观点~还是瞎说的那种)



今天的瞎说,来源于工作这么多年的积累。这么一说,好像满满的都是经验~其实~真的没有~这种“没有”的感觉就像是做到马桶上准备排山倒海但是结果却只有一阵气体一样让人失落。

 
话题好像又扯远了,有些人就是为了不进入主题到处瞎扯。目前的标题好像叫做“如何确定‘真实’人口数量、分布以及流动?”这一看就是标题党嘛,这么大的题目我也肯定写不出来啊。再次,有一说一,什么叫“真实人口”呢,统计的人口不真实嘛?其实我是一点都不在意这一点的,难道我要用玄之又玄的互联网大数据告诉甲方爸爸,你们统计局给我的数据都是假的,我测算出来的才是“真实”的!啊,我自己都不太信呢。也不是信与不信的问题,其实这个吧,就像是,就像是那个,你懂的,就是那个,你明明觉得他可能不对,但你还是觉得他叫做“权威”数据。所谓的“权威”呢,意思就是说,政府背书,就是说,你可以把结果都推脱到“啊数据就是这个样子啊~”其实这样的推脱呢,还真的很有用的样子。反正我胡说八道的能力一直很可以的,看图说话谁不会呢~

那么话就说得很清楚了,目前我把“确定‘真实’人口数量、分布以及流动”的数据分为两类:统计人口与网络人口。

1

统计人口


别看我很爱吐槽统计数据,其实我可喜欢用统计数据了,统计数据才是真的神。基于统计数据确定人口的空间分布就一直是城市研究的传统。统计数据在宏观尺度可以很好地反映一些“通识性”的认知。

什么叫“通识性”的认知?大概就比如胡焕庸线。大家都知道啊,每次做个图想表达什么呢?==表达我的工作量呀!不是不是,我才不是这么斤斤计较的人呢(不,我是)。虽然看上去没啥用,但是可以写个结论比如“统计数据表明,XXXX年至XXXX年,中国人口的空间分布还是维持基本的格局,尚未突破胡焕庸线”。

绘图:作者自绘  数据来源:各省市统计年鉴、中国城市统计年鉴、市州统计年鉴等等

统计数据数据还有个好处就是包含各种尺度,经过“修饰”,这种“二手”数据往往更能体现“规律性”。而且吼,一年年的,除非遇到统计口径变化,一般来说的话,具备了“连续性”这个大杀器。具备了“连续性”就可以反应“趋势”,而不只是“分布”。

绘图:作者自绘  数据来源:中国统计年鉴

不过呢,统计数据这玩意,更新真的太慢了。各省市在19年10月左右出19年统计年鉴,数据为18年底,有一整年的时间差;对于城市研究领域更为专业化的统计资料——《中国城市统计年鉴》,在19年4月左右出的18年年鉴,数据为17年底,有两年的时间差。这这个时间差,用着就很难受,就像是你喝醉了打前女友电话然后在对方接起来“喂?”之后恍然发现这是你前前女友的电话,挂了可惜,不挂难受。大概就是这种感觉。

当然了,还有一个王牌统计数据,叫做人口普查数据。每十年一次。直到现在都还有人在用2010年的六普,虽然老,但是至少大家都说好。这个数据当然也是很有用啊,比如龙瀛老师,据说在当时技术手段还没现在这么有逼格的情况下,呕心沥血利用五普和六普数据发现了“收缩城市”的分布。

来源:龙瀛《收缩城市——中国城市化的另一面》

当然了,基于统计中数据的人口,也不只是所见即所得的“常住人口”这一项。就像“克强指数”用工业用电量新增、铁路货运量新增和银行中长期贷款新增来反映经济运行情况一样,也可以用例如居民用电量、居民用水量以及小学生在校生人数、垃圾生产量等等的指标来估算人口发展情况。反正办法是人想的,有理没理就是你行与你不行的区别咯。


2

网络人口



网络人口这玩意,基于网络账号和LBS定位来确定更为“真实”的人口数量与分布,而且可以更加细化人口精度以及得到人口流向。网络人口得以实现,主要还是得益于互联网时代的到来,就像是老来得子后,你觉得他哪里都好,可是你又说不上来他到底怎么好,而且他总带给你一堆糟心事。

下面两张图,分别是两个团队使用A数据和B数据测算的城市外来人口占比。没打码的显然是我自己做的哈哈哈哈哈,利用17年春节前两周与春节期间的人口变化:反映出人口流动的整体情况。打码的是北大香帅团队利用其独特的“网络人口”计算的常住人口与本地人口的差值占本地人口的比例,评估城市外来人口的占比。方法虽然不同,大体结论是相似的。(大体上~~)

数据源A和数据源B,两种不同计算方式下的外来人口比例,左图为作者自绘,右图来源于香帅(唐涯)报告

利用LBS数据,在大小尺度上都可以得到更为“真实”的人口分布。但是LBS不代表真实人口,想要用LBS反应真实人口免不了奇奇怪怪的计算变换,如何评估正确性也是一个问题。一个简单的思路是假设总盘子一致(14亿人),用“总量分配法”求得不同城市人口与LBS数据之间的关系。

绘图:作者自绘  数据来源:腾讯位置大数据

香帅团队评估其推算的“网络人口”的正确性用的是生活用电量、生活用水量等指标,她们发现网络人口的解释力远高于统计口径的常住人口与户籍人口,这里的解释力应该是R方。

在数据的颗粒度上,网络数据资源比起传统的统计数据有更细化的粒度。对于城市内部“真实”人口的识别,细颗粒高精度更新快的优点,对于分区域配置公共设施、识别人口热点等研究确实具有一定的参考性。再结合POI的分布密度,或者其他什么数据,可以估算出更为“真实”的人口分布图。但是问题还是那个,你怎么确定这是真实的呢?最终还是需要有实测数据作为参照。

绘图:作者自绘  数据来源:腾讯位置大数据

在城市群的层面,借助手机信令数据,不仅可以得到人口的分布,更为常用的是分析城市之间的关联性(或者说城市交往密度)。

手机信令数据对于人口分布与流动的评估  来源:智慧足迹

手机信令有点贵,那我们借助腾讯的迁徙数据,也可以得到类似的分析。(准确性我也不知道)

绘图:作者自绘  数据来源:腾讯迁徙

就像是吃到再好吃的美味也要装作它还有缺点给它一些批评一样,对于网络数据,对于今天的文章,也要瞎BB一些数据的缺点,才能显得全文完整。

如图吧。没啥好说的了,累了。

个人娱乐所作,纯属瞎说,请勿参考,欢迎留言讨论。

那今天就到这里结束啦,欢迎留言讨论。文中的图片文字未经许可不要随便“引用”。

如果可以的话,希望能够转发分享,点个在看并且点个,给赞赏~~也欢迎规范转载~

也希望大家和我多留言互动啊!(据说这样可以增加我的推送在你的订阅号里出现的概率)


往期推荐


  【数据分享】如何获取北京旅游景区AOI数据?
  【数据分享】如何获取全国矢量地铁站点与线路数据?
  【城事数说】方向熵:上海与重庆的道路方向与混乱程度
  【数据整理】2019年行政区划调整的数据更新与分享
  【城事数说】时空圈—大城市之间的比较
  【城事数说】10年间建设用地如何变化?——全国、长三角、上海三个层面的比较
  【GIS技术】多源数据及它们如何应用于规划
  【数据分享】扩张的世界,收缩的城市(分享世界人口密度数据)
  【数据应用】基于微博签到数据的长三角城市群网络活力评价
  【数据分享】地形是如何影响人口与城市分布的?(图多!流量慎点)
  【数据分享·教程】20分钟做一个中国城市经济联系图
  【城事数说】中国的城市联系网络
  【城事数说】大城市的人们都回哪去了?——人口迁徙视角(1)
  【数说城事】基于时空圈测度的京津冀城市群研究



END>

如需全文转载文章、投稿或者合作

可添加微信

(回复超慢!!!)

(不要添加我问各种问题,我大概率不会的==)

(入群请一定要备注入群)

(添加后会在晚上非工作时间通过,请稍安勿躁)


公众号


微博

使用关键词搜索历史文章请点击【阅读原文

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存